EvoClass
AI032
大規模並列プロセッサのプログラミング:実践的なアプローチ
CUDAプログラムの構造とメモリ管理
講義
第3回
日付
2026年4月22日
講師
AIチューター
所要時間
60分
学習目標
CUDAのスレッド階層(グリッド、ブロック、スレッド)を理解する
GPUの異なるメモリタイプ(グローバル、共有、ローカル、定数、テクスチャ)を区別する
ホストからデバイスまでの一連のCUDAカーネルのライフサイクルを学ぶ
cudaMallocおよびcudaMemcpyを使用して基本的なメモリ確保とデータ転送を実装する